提供者:卢梦依
下载地址:http://curtis.ml.cmu.edu/w/courses/index.php/ACE_2005_Dataset
简介
数据集概述
ACE 2005数据集解决了五个主要任务 - 对实体,价值观,时间表达,关系和事件的识别。
该数据集可在语言数据联合会处获得。 数据来自各种来源,可用于以下语言的任务:阿拉伯文,中文和英文。
文件
提供了每个文档的四个版本:
源文本文件(.sgm):所有源文件(包括中文文件)都以UTF-8编码。
APF文件(.apf.xml):ACE程序格式。
AG文件(.ag.xml):LDC注释图格式。
TABLE文件(.tab):存储每个ag.xml文件中使用的ID与其对应的ID之间映射表的文件
apf.xml文件。
本语料库培训部分的详细统计如下:
相关论文
1.Zeng D, Liu K, Chen Y, et al. Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks[C]// Conference on Empirical Methods in Natural Language Processing. 2015:1753-1762.
2.Cai R, Zhang X, Wang H. Bidirectional Recurrent Convolutional Neural Network for Relation Classification[C]// Meeting of the Association for Computational Linguistics. 2016:756-765.
3.Miwa M, Bansal M. End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures[J]. 2016.
4.Zhou P, Shi W, Tian J, et al. Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification[C]// Meeting of the Association for Computational Linguistics. 2016:207-212.